//package com.udf.hive.udf.similarity;
//
//import org.apache.hadoop.hive.ql.exec.UDF;
//import org.apache.hadoop.io.Text;
//import org.xm.Similarity;
//
///**
// * 相似度计算
// */
//public class SimilaritySimpleCompute extends UDF {
//
//    /**
//     * 性能测试，权重统一设置为25%
//     * @param xmmc1
//     * @param xmdz1
//     * @param jsdw1
//     * @param jsdwtyshxydm1
//     * @param xmmc2
//     * @param xmdz2
//     * @param jsdw2
//     * @param jsdwtyshxydm2
//     * @return
//     */
//    public Text evaluate(Text xmmc1, Text xmdz1, Text jsdw1, Text jsdwtyshxydm1, Text xmmc2, Text xmdz2, Text jsdw2, Text jsdwtyshxydm2) {
//
//        // 项目名称
//        double xmmcResult = Similarity.cilinSimilarity(String.valueOf(xmmc1),String.valueOf(xmmc2));
//        // 项目地址
//        double xmdzResult = Similarity.cilinSimilarity(String.valueOf(xmdz1),String.valueOf(xmdz2));
//        // 建设单位
//        double jsdwResult = Similarity.cilinSimilarity(String.valueOf(jsdw1),String.valueOf(jsdw2));
//        // 建设单位统一社会信用代码
//        double jsdwtyshxydmResult = Similarity.cilinSimilarity(String.valueOf(jsdwtyshxydm1),String.valueOf(jsdwtyshxydm2));
//
//        // 返回记录相似度
//        return new Text((xmmcResult + xmdzResult + jsdwResult + jsdwtyshxydmResult) * 0.25 + "");
//    }
//}
